Hari 1:
Pengenalan kepada konsep Big Data dan kenapa penting.
Pemahaman mengenai perkembangan terbaru dalam bidang Big Data.
Pengenalan kepada Hadoop 2 dan perbandingan dengan versi sebelumnya.
Instalasi dan konfigurasi Hadoop 2 pada cluster sederhana.
Praktek: Menginstal Hadoop 2 dan menjalankan tugas sederhana.
Hari 2:
Pemahaman tentang Hadoop Distributed File System (HDFS) dalam konteks Hadoop 2.
Mengelola file dan direktori dalam HDFS.
Replikasi data dalam HDFS dan pengelolaan data yang lebih efisien.
Melakukan transfer data antara sistem lokal dan HDFS pada Hadoop 2.
Praktek: Mengelola data dalam HDFS pada Hadoop 2.
Hari 3:
Pemahaman tentang MapReduce pada Hadoop 2 dan perbedaannya dengan versi sebelumnya.
Menulis dan menjalankan tugas MapReduce pada Hadoop 2.
Proses pengolahan data dalam Hadoop 2 dan peningkatan kinerja.
Menggunakan komponen Hadoop 2 untuk pengolahan data terdistribusi.
Praktek: Menerapkan tugas MapReduce pada Hadoop 2 untuk analisis data.
Hari 4:
Memahami komponen utama ekosistem Hadoop 2, seperti YARN, Hive, Pig, dan HBase.
Pemahaman tentang YARN sebagai manajer sumber daya.
Menggunakan Hive untuk analisis data dengan bahasa SQL-nya pada Hadoop 2.
Pengenalan Pig sebagai alat pengolahan data pada Hadoop 2.
Pengenalan HBase sebagai penyimpanan NoSQL pada Hadoop 2.
Praktek: Menggunakan ekosistem Hadoop 2 dalam skenario nyata.
Hari 5:
Mengembangkan proyek akhir yang melibatkan penggunaan Hadoop 2 untuk pemrosesan data besar.
Merancang, mengimplementasikan, dan menguji proyek.
Pengujian, debugging, dan perbaikan proyek.
Presentasi proyek akhir.
Penyelesaian kursus dan sertifikat.